1800万评论系抄袭?“马蜂窝”被捅之后已立案起诉!
作者 | 小小高
来源 | 互联网新闻网(ID:netxinwen)
这个周末,又有一家互联网公司过得不甚太平!
10月20日,一篇《独家|估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》刷爆朋友圈,文章直接指出“马蜂窝旅行网”涉嫌评论抄袭和造假。
而“马蜂窝”方面也是立马采取措施核查,并连续发布多个声明,试图稳定舆论。不过,在该事件背后,其实还有更加严重的问题需要被审视、被讨论、被解决……
“马蜂窝”85%评论涉嫌抄袭?
“蚂蜂窝”改名“马蜂窝”之后,终于彻底被捅了。
原来,那篇指控“马蜂窝”评论造假的十万+文章指出,一个名“乎睿数据”的团队通过“爬虫”等技术手段对“马蜂窝”进行了数据抓取和分析。
他们发现,“马蜂窝”上有7454个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评。
总计一共抄袭572万条餐饮点评、1221万条酒店点评,占到“马蜂窝”官网声称的2100万条“真实点评”的85%。
而且据说该团队最初只是想写一个模型去鉴定餐饮点评的真假来参加数据比赛,所以只是想拿“马蜂窝”做一个试验,却没想到直接把“马蜂窝”掀了一个底朝天。
当然,仅有一个光秃秃,没有支撑的结论,肯定没有说服力。那么,就让我们看看,这篇爆料文中列举了那些证据?
其一,抄袭账号点评内容多自相矛盾。
比如下图中,性别为“女”的问答小班长二号,先是去桐乡找女朋友,接着在在同一天给老公在上海定了全季酒店,然后和女友在南京汉庭睡得很好。
其二,抄袭Yelp上的英文评论直接调用谷歌翻译接口。
由于是机翻,点评大多狗屁不通,还把“简明英汉词典”给搬运了过来。只要在“马蜂窝”上搜 “简明英汉词典",可以看到大量机翻点评。
其三,抓取的点评内容掺杂了大量其他不相关内容。
譬如下图的点评内容中,参杂了捉奸广告、新闻快讯等对点评内容毫无意义的信息。
此外,这些抄袭账号除了贡献内容和活跃度,还活跃在各种官方的抽奖之中,并且屡次成为各种自由航行,特等奖等大奖的“幸运得主”。
并且,马蜂窝的大部分用户,都集中在周中写点评,而一到周末,就出现断崖式下跌,明显与人的正常行为相违背。
看来,如果《独家|估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》这篇文章的所有内容坐实,“马蜂窝”这个靠所谓“真实点评”崛起的旅行网站,也是“大厦将倾,独木难支”。
“马蜂窝”回应:有组织的攻击行为
对于“马蜂窝”而言,面对以上真假难辨的内容,当然不能示弱,当然不能沉默,一定要夺回主动权。
于是,“马蜂窝”最新的回应来了。就在今天10月22日,“马蜂窝”终于针对“指控马蜂窝评论造假的自媒体文章”发出了一份正式的千字声明。
大致就是说,“马蜂窝”一直以来都在和虚假评论和违规账号作斗争,而《独家|估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》这篇文章中的内容与事实严重不符,已被查证是有组织的攻击行为,将采取法律手段维护自身权益。
而就在今天晚间晚,日前“马蜂窝”被曝“1800万点评造假”一事又有了新进展,北京马蜂窝网络科技有限公司起诉深圳乎睿数据有限公司、丁子荃名誉侵权案已获北京市朝阳区人民法院立案。
提到“马蜂窝”,其也可以说是一家老牌互联网企业了。自2006年正式上线运营以来,自称是“全球旅游消费指南”的“马蜂窝”,已经覆盖了全球200多个国家和地区、1亿位旅行者、92万家国际酒店、2100万条真实点评、3.82亿次攻略下载。
而这一切,无不依赖于其已经被市场认可的UGC(用户原创内容)和PGC(专业生产内容)商业模式:
一方面,它能够通过优质内容和结构化内容,吸引大量的游客来阅读、关注,从而形成流量效应;
另一方面,它通过对内容的模块化处理,以及对目的地碎片化商户的链接,实现了流量的商业化分发。
正基于此,“马蜂窝”在携程系、美团、飞猪占据在线旅游市场大头的现状下,实现了以“原创攻略内容和自由行交易为核心”的差异化竞争。
除此之外,“马蜂窝”还特别重视自己的大数据能力,不仅和中国旅游研究院合作建立了大数据实验室,还通过平台海量的大数据,助力地方政府及旅游企业精准把握市场趋势,优化资源配置,提升效率和旅游服务质量。
不过,此次“马蜂窝”被爆出涉嫌内容评论抄袭之后,作为其大数据分析基础的平台数据估计可信度也会大打折扣,而其所重视的大数据能力也会因此受到影响。
而且,“马蜂窝”凭借洗脑广告语和一个亿的世界杯广告投入所建立起的品牌力量,也会在此次“抄袭事件”的发酵下,大大削弱。
在此之下,“马蜂窝”的新一轮融资也不可避免会受到波及。
互联网数据造假之殇
实际上,互联网公司的“流量泡沫”“数据造假”,已经成了人所共知的潜规则。
并且这些问题自互联网诞生以来就一直存在,从alexa排名造假,到网站内容数据造假,从假结果、假排名到假运营,造假的层次越来越高,越来越逼真。
且不说“马蜂窝”,百度知道、公众号等平台都是数据造假的重灾区,有的是为了内容流量,有的是为了运营丰满。
不过,虽然互联网企业通过“虚假繁荣”带来了“真实繁荣”,但也对被抓取方造成了不公,对消费者造成了误导。而这些问题,也是屡见不鲜。
早在2008年,“去哪儿”网就因为转载搬运携程酒店的点评文章,涉嫌著作权侵权,而与携程对簿公堂,并受到法律的制裁。
也就在今年7月28日,小红书APP官微也曾发布消息称,大众点评疑冒用小红书用户名称账号,批量建立虚假账号,抄袭并搬运用户在小红书发布的原创笔记。
可见,对于各大互联网平台来说,用户真实的评价、攻略等增加平台黏性,提高交易量的UGC内容是多么重要。
难怪,在《独家|估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》这篇文章中,作者说“马蜂窝”2100万条“真实评论”,接近于核心资产。
此外,这也反映了各个旅游社交平台的内容审核存在不可忽视的问题:用户提交的内容是否涉及抄袭、是否为原创,无法得到精准判断。
人为财死,鸟为食亡。内容审核的漏洞,成了许多人获取不正当利益的手段,互联网行业的“数据造假”和“流量泡沫”也愈演愈加泛滥。
所以,此次事件发酵后,貌似只是“马蜂窝”一家企业受到影响,其实是整个互联网行业的“原罪”又要再次被拎出来让大家重新审视审视了。
可是,要审视多少次,互联网的“数据造假”以及“流量泡沫”才能到头呢?
— 【 THE END 】—
感谢原作者辛勤创作!版权问题、商务合作请加QQ/微信:2881339630
↓↓↓猛戳 阅读原文 有更多重磅内容!!!